המרכז 

האקדמי 

לב 


מודיעין עסקי תחרותי 

רכז הקורס: אורי שטרנברג 


יחידה 4 - חיפוש מידע ברשת האינטרנט 


*מי מעלה מידע לאינל\רני\? 




ועוד". 







עיוורה ר׳!\ת 


*קיימת יותר נגישות למידע, אך קשה יותר למצוא מידע רלוונטי, מכיוון 
שהמידע מפוזר ללא הקשר, התוכן לקטני(אקלקטי) ואיכות המידע 
ירודה. 


* 


* 



התיישנות מהירה של מידע, מה שמוביל לכך שקיים מידע 
רב שאינו רלוונטי יותר, אך מצוי בשטח - לעיתים בזמינות 
גבוהה ממידע חדש יותר. 

האתגר: 

לסנן את המידע(§ח 66011 ז ח 1116 ז), שכן באינטרנט קיימים 
כ- 50 מיליארד דפים במעל מאה מיליון אתרי אינטרנט. 
האתרים ודפי האינטרנט הינם בפורמטים שונים. 
כל 8 חודשים לערך האינטרנט מכפיל את כמות המידע 
שבו. בכל יום נוספים כ 2.5-3 מיליון דפים חדשים. 



ארגון המידע ברשת האינל\רנג\ 


*רשת האינטרנט(ה-כ 61 /\/\) אינה מנוהלת כקטלוג ספריה. אין אחידות 
בדרכי ארגון ופרסום המידע. 

* המידע באינטרנט מאורגן במבנה של אתר - 5116 
*אתר מורכב ממסמכים - דפים - 65 § 9 ק 
*קישור בין דפים - > 1 ח 11 

* מעבר בין דף לדף נקראת גלישה - §ח'אחנו 5 

* אחזור מידע נעשה עם היפר-טקסט - : 170611:6x1 ־ 1 









*מבנה כתובת באינטרנט (.ן&ט) 


*המבנה מורכב בדרך כלל מ- 4 אלמנטים: 
*ציון סוג האתר (פרוטוקול ההתקשרות והרשת) 
*שמו(הדומיין שלו) 

*סוג הבעלות על האתר(ממשל, אקדמי, עסקי...) 

*ארץ המוצא או בינלאומי . .. 

/ 11111¥3.00.11 .^\\^\/ /:ק*}![ 

? 9X1 - פרוטוקול התקשרות 
- מציין שזהו דף £8 ^ 

01113111 ( 1 ־ 1111 ¥ 3 ! 

סס - מציין שזו חברה 

11 - ישראל 




שימוש בהיפר ל\קסל\ 1680 ־ו 6 סץ^) 


*ניתן לכתוב דפי אינטרנט בשתי דרכים: 
*ליניארי - ללא שימוש בהיפר-טקסט 

*מתקדם תוך שימוש בהיפר-טקסט. הצגת כמויות טקסט בדרך מקבילה. 






































































*דוגמה גרפית ל׳?\ימו׳¥ 
בהיפר ג\קסג\( 16# ־ז 6 קץ^) 

















































































*המארג הכלל עולמי(מר׳^חח) 

< 1 ©ש 1 ) 1 ־ 01 ^ 

*המארג מכיל כמיליארד צמתים המקשרים בין מסמכים (דפי אינטרנט). 

*במחקר שערכו סטיב לורנס ולי גייילס ממכון המחקר 1£0 ^ 1 אשר בפרינסטון, 
נמצא כי כל מסמך(דף אינטרנט) נמצא במרחק ממוצע של 19 לחיצות מכל 
מסמך(דף אינטרנט) אחר. 

*עולה השאלה: איך הרשת מצליחה לייצר מסלול כל כך קצר בין מסמך למסמך? 

* התשובה נובעת תרמת הקישוריות הגבוהה של הרשתות. 

* מספרם הממוצע של הקישורים בכל מסמך ב- ^/ץ^\הוא בערך שבעה. 

* הדבר אומר שבעוד אנחנו יכולים לעקוב אחר שבעה קישורים בלבד מהמסמך הראשון, ישנם 
49 קישורים במרחק שתי לחיצות, 343 במרחק שלוש לחיצות וכך הלאה. 

* כך, נגיע לצמתים הנמצאים במרחק 19 קישורים רק לאחר שנבדוק 10 מסמכים בחזקת 16 - 
פי עשרה מיליון ממספר הדפים במארג... 


המארג הכלל עולמי(מר׳?\תת) 

נ 61 ^ 1 ) 1 ־ 01 ^ 

*שאלה נוספת שעולה עוסקת באקראיות של המארג. 

* ההשקפה ששלטה משר עשרות שנים, אשר לפיה הרשתות הן אקראיות, נבחנת 
בימים אלו מחדש... 

* המודל החדש מציע הסבר פשוט של התקבצות לצבירים, המכנס את הרשתות 
האקראיות למקבצים בעלי מכנה משותף כלשהו. 

* כך מיפוי הצבירים גורם למארג להיראות כמו'עולם קטן' בעל היגיון הדומה 
לעולמנו שלנו. 

* אם קיימים קישורים למספר גדול של צמתים, בצבירים נוצרים מסלולים קצרים 
בין כל שני צמתים במערכת. 

* כתוצאה מכך בעוד שכל שני מסמכים במארג נמצאים במרחק 19 לחיצות זה 
מזה, אפשר להגיע באמצעות צמתים למרבית המסמכים ברשת באמצעות 2-3 
לחיצות בלבד. 


* 


דוגמה גרפית לצביר מידע 
המכיל מספר צמתים 





























































































































































































































עבודה עם צבירים וצמחי מידע 


* לא עוקבים אחר כל הקישורים, אלא מחפשים רמזים. 

* מספקים פרשנות לקישורים. 

*האם מדובר בקשר הדוק או בקשר חלש ומקרי. 
*איתור צמתי מידע - אתרים עם הרבה קישורים. 





*דוגמאות לצמחי 


*פורטלים 

*מדריכים אינטרנטיים 
*אינדקסים 
*מנועי חיפוש 

*כלי יעץ - מילונים ואנציקלופדיות 
*קבוצות דיון 
*רשתות חברתיות 
*בלוגים 

*אתרי מסחר ומאגרי מידע מסחריים 


מידע באינטרנט 


*פורטל(|ס־ן 0 ק כ 61 /ץ, פורג\ן) 


*שער, כניסה או פתח. 

*אתר המהווה נקודת התחלה לגלישה. 

*פורטל יכול להוות שער לגלישה בתחום מסוים. 
לדוגמה: פורטל טכנולוגי הוא שער לאתרים בנושאים טכנולוגיים. 

*פורטלים מעניקים שירותים: תיבת דואר, שירותי מידע בנושאי בורסה, 
קניות מקוונות, חדשות ועוד. 



עוז־ בוואלר.! > £01-1 ז גבר בית ברח־ר■ רזוניורב ס־נגלס ■הדות 0X0 >< כ־ף • 7 *ז־־בו מוגוב• 7 ׳* 7 *ופו אורח לחץ באן 7 *< 5 ר 1 *רורנ חשבון ס■ נס 

שימוש• > אסטרולוגיה סרטים טלוותיה 14-4 ;עוד מוסיקה בדו 7 * טוב 70 ־ 711 * •ועצי□ והכרויות ׳; קרא דואר ^ מכתב חדש 

קניות > ווא 7 *רז 1 שופס !־• 7 * ■ובו• ויאלר.! טורס א 7 *בומ• תמונות מבצעי□ טיסות רזכ^חארד מרו■ דיס 


* 9 ^> ^ **י 

צפייה ■שירה > סרס־□ סדרות ותוכניות הופעות *־!•ורב 65 ץ ו־ורז י 7 *ד־בו ב־יק 7 *יז־'און מזב אוויר־ מפות מ־ 7 * 11 צ־אט פורומים בעל■ מקצוע 





























דוגמה לפורקל קווי תחבורה 


פורסל קוו• תחבורה בישראל 

משרד התחבורה - 1 ז 0 גן 5 ח 3 ז 071 7 ו) 13 ת 1 ו/\ 1 


מרכז מידע ארצי 

8787 * 

9998787 ־ 052 

2588787 ־ 072 



מוצא ויעד 



26.08.2015 אגד: ירושלים, קו 136 לקבר שמואל הנביא - שינו• סטטוס תחנות 
26.08.2015 אגד: ירושלים, קו 16 - תוספת תחנה בשדרות הרצל 


תאריך 29 / 03/20151 - יום ש ✓י| משעה ] הכל ^ 
מוצא, תחנת עליה 

•שוב 0 1 

מקום בישוב מיון לפי © חשיבות 0 א י ב' 

1 * 1 

חיפוש לפי כתובת 

יעד. תחנת ירידה 


פורטל קווי תחבורה בישראל מספק מידע לנוסע בתחבורה הציבורית, 
האתר מציע קווים ולוחות זמנים של כל חברות האוטובוסים ורכבת ישראל 
כולל שילוב קווים של מפעילים שונים. 
תכנן את נסיעתך באתר אחד. 

תוכל לחפש לפי מוצא ויעד, לפי מס קו או בשפה חופשית. 
באתר מידע של החברות: אגד,אגד תעבורה,אפיקים,ג.ב. טור 0 ,גלים,דן, 
כרמלית,מטרודן,מטרופולין,נסיעות ותיירות,נתיב אקספרס,סופרבוס, 
עילית, קווים, ויאוליה ,רכבת ישראל, רכבת קלה בירושלים, ש.א.ם 

חניוני חבח וסע חרשים, פייטים באחד: 1 ו. €0 . 6 ח 511 ט^.עעשא< 


0 
































דוגמה לפןרכ\? דרןשים 


389 ן 3 

ו + 8 6,024 




סורטל ו^נוווןיו 

^ אין משרות בסל | £ שלום אורח, התחבר | הרשם 




מעסיקים 

צור קשר איזור אישי 

סוכן חכם 

קורות חיים 

כל הקטגוריות 

דרושים דרושים ה״טק 


| חפש משרות ||| 

0 

כל האיזורים 

0 


כל הקטגוריות 



דרושים ה״טק 



רכב / תחבורה 


משאבי אנוש 

כלל• 

אדמיניסטרציה 

חומרה 



רפואה / בריאות 


עבודה בחו״ל 

כספים 

ביטוח 

כלל• 



שיווק 


עבודה מהבית 

לוגיסטיקה / שילוח 

בכירים / ניהול 

תוכנה 



שירות לקוחות 


עיצוב 

מדעים / ביוטק 

בעלי מקצוע 

0/\ 



שמירה / אבטחה 


עריכת דין 

מכירות 

הדרכה / הוראה 

אינטרנט 



תעשיה / "צור 


פרסום / מדיה 

מסעדנות / תיירות 

הנדסה 


הסוכן החכם 

לקבלת משרות באימייל הרשמו כאן 

חזן כתובת אימ״ל 

בחירת קטגוריה 


הצטרף חינם 


טבלאות שכר 

נתוני שכר מעודכנים לפי תחום 


0 


מחשבון שכר 

מברוטו לנטו 


קורות חיים 

קבלו קורות ח״ם מקצועיים, ובחינם! 


0 


מידע ומאמרים 

מדריכים וטיפים לחיפוש עבודה 


פורטל דרושים - זה עובד! 


מעסיק, 

מחפש 

עובדים? 

עשרות אלפ■ 
מועמדים ביום! 


פרסם משרות עכשיו! 


חברות מובילות באתר 

\/ 0 ץ 0 ז׳*> 


סופר־פאר□ 


0 


ז 5£01£ 5 *ו*ס 01 וע 

4 ) 1 * 0 **)?* * רדע*" 



























מדריך אינטרנטי 


* קטלוג של אתרי הרשת, המחולק לקטגוריות ותת קטגוריות המסודרות 
בצורה היררכית. 

* המדריך הוא אינדקס אתרים הנעשה לרוב על ידי בני אדם (ולא תוכנה). 

* מכיל כמות קטנה יחסית של אתרים. 


הוסף אתר 1 אתרים חדשים 

כלכלה וזגסקים 

חברות. בדל״ו. שוק-ה ה 11 . ; 8 > 

ספורט 

כדורגל. כדורסל. הרפתקני. £■ 

מדריך אתרי אינטרנט 

הנא■ ובידור 

קו לנו 1.1 . מוסיקה. מפורסמים. £■ 

קניות 

תיירות ונופיו 

מתחבבים ואינטרנט 

מוסיזזה. ספרים. מחשבים. 

בישראל. בשלם. בתי מלון. ^ 

מי^ח 7 זים. תוכנות. איבסרבט. :$■ 

חברה וקהילה 

אמנות 

חדז^ות ומדריכים 

הכרויות. משפחה. בוער. £■ 

ציור. מוזיאונים. אלטרנטיבי. ; 8 > 

מדריכים. אנציקלופדיות. : 3 > 

בריזוות ורפואה 

חינוך ומדע 

חוק ומיננשל 

בתי-חולי□ וקו פ"ח. משלימה. # 

אוניברסיטאות. בתי־ספר. 

משרדי ממשלה. משפט. : 3 ■ 






















































*פור?\ל יכול להיות גס נזדריר 


*בשנת 1994 שני דוקטורנטים להנדסה אלקטרונית פרשו מהלימודים 
באוניברסיטת סטנפורד והחלו לפתח פרויקט תיעוד חדשני באינטרנט. 

*שם הפרויקט המלא: 3016 ־ 01 0111010115 0111031 ־ 31 ־ 1161 ־ 1 ' ¥6140011161 


*כולל מעל 100 מיליון אתרים, המסווגים ומאורגנים בב - 25,000 

0 ז 0 וו^וו 4 חוטזו 11 _ז־ 41 • ־ !טטוו 4 ו ;! 11414 11111114 ־וו 1 ו 1 ץ ! 14111111 ; 1 * 14 ־ 1 

^ $ $ "5X15 001 ^ % # 

ץ 90 ח 6£50 וי^ ! 00 ר ¥31 1311 /ח יי! 9 ח 1 קק 0 ר 51 : 511 □^ יי! 0 מח 3 ח 1 ק 



קטגוריות נושאיות. 


65 ו) 310 ^\, £101/1/6/5,11096116 , 63119015 , 161/1/0117 , : 15 ) 91 ץ 03 5 ' 6 וז 1 )ח ¥316 11 וו £1 - 9 ח 1 קק 0 ו 51 ! 100 ) ¥3 



1 ) 014 חס 011 ז^ 6 * 1 * פז!□? ► 

63 ( 186588 ^: 16 | 4 18 ^- £668 6 ל 1 ז 16 

:• 1 :׳ 3 י::׳ 60 ־ £3 - £3 ח 6 נן 0 - ח 0 נ) 3 ' 11 >ץו 1:1 ט 0 ( 31 ודו 1.63 


9 66 ק □ו] 1 ,חתק 12:09 5 /י 61 א 1116 ח 1 


ח 1 חן> $1 : 3105 ) 3115 וח ׳ 1/0111 ;) 160 ) 0 \יי _) 

(] 11 ח^ 81 : 111311 סס/! 

ס 360 

65 ק 0500 ׳ו 10 ־ 1 

(101/165 

(1631 £5(316 

/\0(05 

(10(10115 

(10510 

5(10(1 [1109 

£103006 
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! 100 ) 3 ¥ ץ 1 ) 
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65 וח 03 

10031 

(161/1/5 
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£6/500315 

¥01101/1/ ?3^05 

(1631111 

(10(1110 

£110105 

... 05 ^ח $0 !? 411 



















*איר מאתרים מידע? 


*איתור צמתי מידע רלוונטיים לתחום החברה. 
*איתור פורטלים בתחום הידע של החברה. 
*איתור אתרי אינטרנט בנושא החברה או אתרי חברות מתחרות. 


*היכרות עם הקטגוריות הרלוונטיות לתחום הידע במדריכי האתרים 
המסווגים ומאורגנים של קטגוריות היררכיות מקטגוריות על ועד לתת 
קטגוריות. 
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